西文键盘是中国人使用电脑的一大障碍。从“万码奔腾”到“手写烽烟”,人们一直在苦苦寻求最适合中国人的人机对话方式。如果能做到会说中国话,就会用电脑,那该多好!最近,由国家863智能计算机成果转化基地、天音计算机公司推出的“中国话王”中文语音平台,使人们朝这一梦寐以求的目标又迈进了一步。
记者看到,只要会说普通话,带点四川、上海、广州口音也不要紧,先说5个词、3句话完成口音适应,然后就可以输入文章了。输完后,机器还可以用流畅、标准的普通话朗读一遍,发现有错的地方你用键盘或手写方式改一下即可。用这种方法,一分钟可以输入200个左右的汉字。记者有南方口音,读了一段200多字的话,共错了3个字。
天音公司总经理廖杰远介绍,人机对话已经历了Dos下的键盘阶段和Windows下的鼠标图形界面阶段,但真正理想的人机对话方式是自然语言对话方式。全世界都在为实现这个理想而努力。语音技术包括语音识别和语音合成技术。IBM的ViaVoice率先实现了中文语音识别技术的突破。而中文语音合成技术则是由我国科技人员率先实现突破的。863计划制定之初就把语音合成列为智能计算机领域的一个重要课题,先后支持清华大学、中科院声学所、中国科技大学等8家单位进行攻关。1997年底,中国科技大学人机语音通信实验室在十几年语音技术研究和积累的基础上,独创了以“人声道模拟技术”为基础的KD—863系统,一举突破了语音合成清晰度与自然度的制约瓶颈。“中国话王”融合了中文语音识别(ViaVoice98)和语音合成的最新技术,开创了中文语音平台的新概念。
它不仅能为个人电脑用户提供语音导航、语音听写、语音校对、语音秘书等功能,而且为各种软件开发商提供了广阔的二次开发的平台。如语音翻译软件,你用汉语说一个词,电脑立刻说出它的英语;语音浏览器,你可以用“说”完成浏览器的各项操作,包括选定一篇邮件,让电脑替你朗读;语音游戏软件则让你可直接用语言进行命令:出左拳、踢右脚……游戏中的人物还能用语音回应你。也可把计算机中各种操作、提示都用汉语告诉你,不懂英语的人操作起来就不再难了。
中文语音平台还为各种行业应用开辟了崭新的天地。例如全国160、168电话声讯系统过去采用录音存储,设备昂贵,效率低下,维护困难。改用语音数字存储后,设备成本及维护成本将仅为原来的20%。将该系统装在邮件服务器上,收到邮件后它可自动拨打用户的预留电话,把邮件的内容念给用户听。每年高考,考生千方百计托人查自己的考分,把语音技术用到高考查分系统中,考生只要用电话键入自己的考号,电话即可告诉你总分、分科分、你的成绩达到哪几个大学的要求等。它还可以用于工商系统、民航系统、证券系统……
专家预测,语音技术的个人用户不会超过20-30%,而它的二次开发和行业市场将超过70%。面对这一巨大的市场,微软、摩托罗拉、Philips等业界巨人和新加坡创新等业界新秀无不跃跃欲试。目前,天音集中了中国科技大学信息通信和计算机专业的精锐力量,包括优秀的少年班硕士,一举开发了电信、银行、工商、证券、因特网、企业、教育、民航等8个领域的应用系统。在世纪之交的这场技术变革中,我国已有了一个良好的开端,我们期盼在这一领域,中国人能占据自己的一席之地。